Первое применение машинного обучения для ранжирования результатов поиска.
Через два года заработала технология Матрикснет — собственная реализация градиентного бустинга на решающих деревьях.
Комплекс речевых технологий, который позволял распознавать и синтезировать речь, а также решал задачу понимания естественного языка.
Именно на базе SpeechKit была позднее разработана Алиса — голосовой помощник Яндекса.
Яндекс представил технологию прогноза погоды на базе машинного обучения на основе данных метеостанций.
На следующий год в Meteum появился нейро-сетевой прогноз осадков и обновляющиеся карты дождя и снега.
Сейчас Meteum использует также сигналы пользователей, атмосферных радаров, любительских метеостанций и предсказания пяти метеорологических моделей.
Заработал поисковый алгоритм «Палех». Впервые нейросетевая модель определяла релевантность заголовка веб-страницы по запросу пользователя.
На следующий год, в алгоритме «Королёв», модель сопоставляла запрос уже не только с заголовком, но и с текстом страницы.
Уже при запуске Алиса распознавала речь с точностью, близкой к человеческой. Она была первым в мире голосовым помощником, который не ограничивался набором заданных ответов.
На следующий год была выпущена первая Яндекс Станция — мультимедийная колонка с Алисой на борту.
В Яндекс Браузере заработал англо-русский перевод видео в режиме реального времени. В нём используется цепочка нейросетевых моделей, решающих разные задачи: определение пола, распознавание речи, обработка текста, перевод и озвучивание.
К 2025 году перевод работает уже для восьми языков.
В Умной камере сочетаются ИИ-технологии компьютерного зрения, перевода, поиска и генеративных ответов.
Она определяет объекты, которые видит, и выполняет с ними полезные действия — находит релевантную информацию, распознаёт и переводит текст, отвечает на вопросы.
YaLM — языковая модель-трансформер с 13 млрд параметров — была создана для ранжирования и генерации ответов в поиске и Алисе.
Позднее появилась модель на 28 млрд параметров. А в 2022 году Яндекс выложил в открытый доступ YaLM на 100 млрд параметров.
Нейросетевые модели YandexGPT, разработаннаые на основе YaLM, отвечают на вопросы в Алисе и Поиске с Нейро, улучшают тексты в Браузере и используются в десятках других сервисов Яндекса.
Эти модели доступны внешним разработчикам в Yandex Cloud.
Нейросетевая модель YandexART генерирует изображения и короткие видео в приложении Шедеврум. Она же работает в Браузере и Алисе, помогает создавать рекламные креативы в Директе.
В 2024 году вышло второе поколение YandexART на базе гибридной модели, сочетающей свёрточную и трансформерную нейросети.
YandexART доступна для интеграции во внешние сервисы через Yandex Cloud.
Нейро объединяет возможности Поиска и YandexGPT: ему можно задать любой вопрос — и получить подробный и подтверждённый источниками ответ.
В октябре 2024 года Нейро заработал в Поиске и Умной камере: сервис может рассказать о картинке или объяснить, как решить задачу.